图解redis的持久化存储机制RDB和AOF的原理和优缺点

作者：mobiledu2502912043 | 来源：互联网 | 2023-12-13 20:24

本文通过图解的方式介绍了redis的持久化存储机制RDB和AOF的原理和优缺点。RDB是将redis内存中的数据保存为快照文件，恢复速度较快但不支持拉链式快照。AOF是将操作日志保存到磁盘，实时存储数据但恢复速度较慢。文章详细分析了两种机制的优缺点，帮助读者更好地理解redis的持久化存储策略。

篇首语：本文由编程笔记#小编为大家整理，主要介绍了图解redis的持久化存储机制 RDB和AOF相关的知识，希望对你有一定的参考价值。

redis的持久化存储策略

redis是一个高性能的缓存数据库&＃xff0c;既然是缓存&＃xff0c;它的数据就是存储在内存中的&＃xff0c;如果说服务器断电了&＃xff0c; 或者重启了&＃xff0c;或者redis宕机了&＃xff0c;他的数据就一定会丢失&＃xff0c;所以为了解决这个问题&＃xff0c;在丢失数据之前就将数据给持久化保存到磁盘&＃xff0c;这种持久化技术&＃xff0c;就是RDB和AOF

什么是RDB

redis Database 的简写&＃xff0c;是将redis内存中的数据保存为一个快照文件&＃xff0c;类似Jmap的dump堆转储功能&＃xff0c;但rdb是时点性的&＃xff0c;只能存储某一时刻的快照&＃xff0c;不能实时存储&＃xff0c;如果单单使用rdb&＃xff0c;它的数据就一定会丢失&＃xff1b;

RDB优点

以快照的方式存储&＃xff0c;所以恢复速度相对较快&＃xff0c;
不支持拉链式的快照&＃xff0c;也就是说&＃xff0c;生成的快照文件永远只有一个&＃xff1b;

RDB缺点

因为是时点性的&＃xff0c;在持久化时将数据保存到磁盘需要一定的时间&＃xff0c;在这段时间内可能会有其他的写操作&＃xff0c;所以容易丢失数据

持久化触发方式

RDB的持久化触发方式有2种&＃xff0c;分别为手动触发和自动触发&＃xff0c;手动触发只需要登陆redis后输入相应的命令即刻&＃xff0c;自动触发需要配置持久化的规则&＃xff1b;

1、手动触发RDB

手动触发RDB持久化方式的命令有2种&＃xff0c;分别是阻塞和异步&＃xff1a;

save&＃xff1a;执行save命令后redis进入阻塞状态&＃xff0c;在RDB生成快照期间&＃xff0c;redis不能执行其他命令&＃xff0c;直到RDB完成方可解除阻塞状态&＃xff1b;
bgsave&＃xff1a;执行bgsave命令后&＃xff0c;redis会以异步的方式进行持久化操作&＃xff0c;以fork的方式创建一个子进程&＃xff08;注意是进程&＃xff0c;不是线程&＃xff09;&＃xff1b;RDB持久化操作由子进程负责&＃xff0c;完成后自动结束子进程&＃xff1b;在异步持久化期间&＃xff0c;redis可以正常执行命令&＃xff1b;不会有任何影响&＃xff1b;阻塞只发生在fork阶段&＃xff0c;一般时间很短

注意事项

在命令行登录redis后输入save或者bgsave即可持久化存储&＃xff1b;
基本上 Redis 内部所有的RDB操作都是采用 bgsave 命令。
执行执行 flushall 命令&＃xff0c;也会产生dump.rdb快照文件&＃xff0c;但里面是空的.

2、自动触发RDB

先进入redis目录,打开redis.conf配置文件&＃xff0c;找到以下几项配置:

rdbcompression yes &＃xff1a;默认值是yes。对于存储到磁盘中的快照&＃xff0c;可以设置是否进行压缩存储。如果是的话&＃xff0c;redis会采用LZF算法进行压缩。如果你不想消耗CPU来进行压缩的话&＃xff0c;可以设置为关闭此功能&＃xff0c;但是存储在磁盘上的快照会比较大。
rdbchecksum yes&＃xff1a;默认值是yes。在存储快照后&＃xff0c;我们还可以让redis使用CRC64算法来进行数据校验&＃xff0c;但是这样做会增加大约10%的性能消耗&＃xff0c;如果希望获取到最大的性能提升&＃xff0c;可以关闭此功能。
dbfilename dump.rdb&＃xff1a; 设置快照的文件名&＃xff0c;默认是 dump.rdb
dir /usr/local/redis/rdb&＃xff1a; 设置快照文件的存放路径&＃xff0c;这个配置项一定是个目录&＃xff0c;而不能是文件名。默认是和当前配置文件保存在同一目录。

自动触发RDB的持久化条件

save "" &＃xff1a;如果不想要使用RDB&＃xff0c;可以使用此配置关闭 RDB功能
save 900 1&＃xff1a; 900 秒内如果至少有 1 个 key 的值变化&＃xff0c;则进行持久化保存
save 300 10&＃xff1a; 300 秒内如果至少有 10 个 key 的值变化&＃xff0c;则进行持久化保存
save 60 10000&＃xff1a;60 秒内如果至少有 10000 个 key 的值变化&＃xff0c;则进行持久化保存

bgsave底层原理

前置知识 - linux的fork函数、copy on write&＃xff08;流程图&＃xff09;

在了解异步RDB原理之前&＃xff0c;我们需要先了解fork是个什么玩意&＃xff1b;

调用fork函数后&＃xff0c;linux会创建一个与原来进程几乎完全相同的进程&＃xff0c;也就是两个进程可以做完全相同的事&＃xff0c;但如果初始参数或者传入的变量不同&＃xff0c;两个进程也可以做不同的事。

一个进程调用fork&＃xff08;&＃xff09;函数后&＃xff0c;系统先给新的进程分配资源&＃xff0c;例如存储数据和代码的空间。然后把原来的进程的所有值都复制到新的新进程中&＃xff0c;只有少数值与原来的进程的值不同。相当于克隆了一个自己。

在克隆时&＃xff0c;需要满足2个条件&＃xff0c;

速度要快
占用内存空间要小

为了满足以上2点要求&＃xff0c;linux使用了copy on write机制&＃xff08;写入时复制&＃xff09;&＃xff0c;也就是说&＃xff0c;虽然是克隆了2一个子进程出来&＃xff0c;但是父子进程种变量的内存指针还是指向同一个内存空间&＃xff0c;比如一开始都父子进程的变量A的值都是123&＃xff0c;但我修改子进程变量A的值时&＃xff0c;改为456&＃xff0c;那么操作系统会先在内存写入新的值456&＃xff0c;然后在将子进程的变量A指向新的内存值456&＃xff1b;

克隆后的进程为子进程&＃xff0c;常规情况下&＃xff0c;子进程和主进程之间的数据完全隔离&＃xff1b;互不影响&＃xff1b;子进程的修改不会破坏父进程&＃xff0c;父进程的修改也不会破坏子进程&＃xff1b;

bgsave原理&＃xff08;流程图&＃xff09;

在输入bgsave命令后&＃xff0c;redis在内部做了以下几件事

通过fork函数创建一个子进程&＃xff1b;此方法会产生阻塞&＃xff0c;但时间很短&＃xff1b;
redis的增删改查由父进程负责&＃xff1b;
持久化RDB由子进程负责&＃xff1b;
持久化完成后&＃xff0c;子进程自动结束&＃xff1b;

AOF

append only file的简写&＃xff0c;意思是只会向文件追加&＃xff0c;指的是客户端对redis的增、删、改操作&＃xff0c;会以追加的形式将操作语句保存到文件中&＃xff1b;

AOF优点

恢复时丢失数据少
RDB和AOF可同时开启&＃xff1b;在4.0以前恢复时只用aof恢复&＃xff1b;4.0以后使用混合型的持久化机制&＃xff0c;下文会介绍

AOF缺点

速度较慢&＃xff0c;每次写操作都会写磁盘&＃xff1b;

rewrite机制&＃xff08;重写&＃xff09;

为什么需要rewrite

我们都知道磁盘空间是有限的&＃xff0c;但是redis的增删改的命令却是无穷无尽的&＃xff0c;为了保证磁盘不被占满&＃xff0c;就需要引入rewrite机制&＃xff1b;在命令行输入以下指令即可触发rewrite重写AOF文件&＃xff1b;

BGREWRITEAOF

rewrite原理

rewrite机制是自动触发的&＃xff0c;需要设定一个阈值&＃xff0c;也就是你的aof文件大小的阈值&＃xff0c;比如我设置大小为64M时&＃xff0c;当aof文件大小达到64M就会自动触发rewrite机制&＃xff0c;会对aod文件做些优化&＃xff0c;去掉一些过程重复的命令&＃xff1b;比如我连续执行了下面的命令

set name yexindong set name zhangsan set name lisi

那其实&＃xff0c;name最终的结果是lisi&＃xff0c;也就是第三个命令&＃xff0c;第一个和第二个执不执行都不会影响最终的结果&＃xff0c;所以当aof文件叨叨64M时&＃xff0c;rewrite原理触发&＃xff0c;就会将下面的语句删除

set name yexindong set name zhangsan

最后只保留set name lisi的语句&＃xff1b;去掉中间没用的语句&＃xff0c;优化就完成了&＃xff1b;经过这一次瘦身&＃xff0c;aof文件就会变得更小了&＃xff1b;

AOF使用

同样的&＃xff0c;AOF也需要在配置文件中进行相关配置&＃xff1b;

appendonly no&＃xff1a; 默认值为no&＃xff0c;也就是说redis 默认使用的是rdb方式持久化&＃xff0c;如果想要开启 AOF 持久化方式&＃xff0c;需要将 appendonly 修改为 yes。
appendfilename "appendonly.aof"&＃xff1a;AOF文件名称&＃xff0c;配置后&＃xff0c;就会将写指令追加到这个文件内
dir /usr/local/redis/rdb&＃xff1a; AOF文件的保存目录&＃xff0c;与RDB一致
appendfsync&＃xff1a;aof持久化策略的配置&＃xff1b;
- no&＃xff1a;表示不执行fsync&＃xff0c;由操作系统保证数据同步到磁盘&＃xff0c;速度最快&＃xff0c;但是不太安全&＃xff1b;
- always&＃xff1a;表示每次写入都执行fsync&＃xff0c;以保证数据同步到磁盘&＃xff0c;效率很低&＃xff1b;
- everysec&＃xff1a;&＃xff08;默认的&＃xff09;表示每秒执行一次fsync&＃xff0c;可能会导致丢失这1s数据。通常选择 everysec &＃xff0c;兼顾安全性和效率。
no-appendfsync-on-rewrite&＃xff1a;在aof重写或者写入rdb文件的时候&＃xff0c;会执行大量IO&＃xff0c;此时对于everysec和always的aof模式来说&＃xff0c;执行fsync会造成阻塞过长时间&＃xff0c;no-appendfsync-on-rewrite字段设置为默认设置为no。如果对延迟要求很高的应用&＃xff0c;这个字段可以设置为yes&＃xff0c;否则还是设置为no&＃xff0c;这样对持久化特性来说这是更安全的选择。设置为yes表示rewrite期间对新写操作不fsync,暂时存在内存中,等rewrite完成后再写入&＃xff0c;默认为no&＃xff0c;建议yes。Linux的默认fsync策略是30秒。可能丢失30秒数据。默认值为no。
auto-aof-rewrite-percentage&＃xff1a;默认值为100。这个值是个百分比的数值&＃xff0c;aof自动重写配置&＃xff0c;当目前aof文件大小超过上一次重写的aof文件大小的百分之多少进行重写&＃xff0c;即当aof文件增长到一定大小的时候&＃xff0c;Redis能够调用bgrewriteaof对日志文件进行重写(rewrite)。当前AOF文件大小是上次日志重写得到AOF文件大小的二倍&＃xff08;设置为100&＃xff09;时&＃xff0c;自动启动新的日志重写(rewrite)过程。
auto-aof-rewrite-min-size&＃xff1a;64mb。设置允许重写(rewrite)的最小aof文件大小&＃xff0c;避免了达到约定百分比但尺寸仍然很小的情况还要重写(rewrite)。
aof-load-truncated&＃xff1a;aof文件可能在尾部是不完整的&＃xff0c;当redis启动的时候&＃xff0c;aof文件的数据被载入内存。重启可能发生在redis所在的主机操作系统宕机后&＃xff0c;尤其在ext4文件系统没有加上data&＃61;ordered选项&＃xff0c;出现这种现象 redis宕机或者异常终止不会造成尾部不完整现象&＃xff0c;可以选择让redis退出&＃xff0c;或者导入尽可能多的数据。如果选择的是yes&＃xff0c;当截断的aof文件被导入的时候&＃xff0c;会自动发布一个log给客户端然后load。如果是no&＃xff0c;用户必须手动redis-check-aof修复AOF文件才可以。默认值为 yes。

aof使用注意事项

要使用AOF功能&＃xff0c;在启动时不能直接运行redis-server。一定要加配置文件运行./redis-server /etc/redis/redis.conf&＃xff0c;加了配置文件后AOF功能才会生效

AOF文件内容说明

首先我们执行下面这个命令&＃xff0c;看看aof文件中都保存了哪些东西&＃xff1b;

set k1 hello

然后通过命令打开aof文件 vim appendonly.aof&＃xff0c;可以看到以下内容

*2 // *开头表示是一个新命令&＃xff0c;这个命令有2个元素组成 $6 // $开头表示下一行命令的字符长度 SELECT // 选择库的指令&＃xff0c;redis有16个库&＃xff1a;0~15之间 $1 0 // 和上面的命令组成为&＃xff1a;SELECT 0&＃xff0c;表示选择0号库 *3 // 下一个命令&＃xff0c;这个命令有3个元素组成 $3 // 下一行的命令长度 set // set命令 $2 k1 // key 的名称 $5 hello // key的值&＃xff0c;和上面2个命令组成&＃xff1a;set k1 hello
Redis是如何进行持久化的&＃xff08;流程图&＃xff09;

在reids4.0的以后&＃xff0c;提供了一种混合型的持久化机制&＃xff0c;就是RDB &＃43; AOF的持久化方式&＃xff1b;在配置文件中会有以下配置&＃xff0c;设置为yes表示开启&＃xff0c;设置为no表示禁用。默认为yes

aof-use-rdb-preamble yes

当开启混合持久化时&＃xff0c;主进程先fork出子进程将现有内存副本全量以RDB方式写入aof文件中&＃xff0c;然后将缓冲区中的增量命令以AOF方式写入aof文件中&＃xff0c;写入完成后通知主进程更新相关信息&＃xff0c;并将新的含有 RDB和AOF两种格式的aof文件替换旧的aof文件。

也就是说&＃xff0c;RDB 和 AOF文件是在同一个文件里面的&＃xff0c;在进行备份的时候&＃xff0c;比如是2点整进行备份的&＃xff0c;先将这个文件先删除掉&＃xff0c;然后将当前的数据以RDB快照的方式保存到aof文件种&＃xff0c;最后&＃xff0c;以增量的方式将增、删、改命令追加到AOF文件中&＃xff1b;这样就可以保证重启或者断电后&＃xff0c;恢复数据会保持和断电前一致了&＃xff1b;

简单来说&＃xff1a;混合持久化方式产生的文件一部分是RDB格式&＃xff0c;一部分是AOF格式。

这种方式优点我们很好理解&＃xff0c;缺点就是不能兼容Redis4.0之前版本的备份文件了。

数据恢复

启动redis时&＃xff0c;redis会自动加载rbd文件和 aof文件进行数据恢复&＃xff1b;前提是得先开启相应的配置后才会恢复数据&＃xff0c;配置如下

# 开启 AOF 持久化配置 appendonly yes # 开启 RDB持久化配置 rdbcompression yes

推荐阅读

bit
优化ListView性能

本文深入探讨了如何通过多种技术手段优化ListView的性能，包括视图复用、ViewHolder模式、分批加载数据、图片优化及内存管理等。这些方法能够显著提升应用的响应速度和用户体验。 ... [详细]

蜡笔小新 2024-12-28 10:36:30
format
编写有趣的VBScript恶作剧脚本

本文将介绍如何编写一些有趣的VBScript脚本，这些脚本可以在朋友之间进行无害的恶作剧。通过简单的代码示例，帮助您了解VBScript的基本语法和功能。 ... [详细]

蜡笔小新 2024-12-28 09:46:23
format
HDFS与Hive中的数据存储和管理机制

本文探讨了Hive中内部表和外部表的区别及其在HDFS上的路径映射，详细解释了两者的创建、加载及删除操作，并提供了查看表详细信息的方法。通过对比这两种表类型，帮助读者理解如何更好地管理和保护数据。 ... [详细]

蜡笔小新 2024-12-27 20:21:48
post
新浪笔试题

1:有如下一段程序：packagea.b.c;publicclassTest{privatestaticinti0;publicintgetNext(){return ... [详细]

蜡笔小新 2024-12-27 19:32:17
post
网络链路质量监控：Smokeping部署与配置

本文详细介绍了如何在Linux系统上安装和配置Smokeping，以实现对网络链路质量的实时监控。通过详细的步骤和必要的依赖包安装，确保用户能够顺利完成部署并优化其网络性能监控。 ... [详细]

蜡笔小新 2024-12-27 19:31:05
version
深入理解设计模式与七大原则

本文详细探讨了Java中的24种设计模式及其应用，并介绍了七大面向对象设计原则。通过创建型、结构型和行为型模式的分类，帮助开发者更好地理解和应用这些模式，提升代码质量和可维护性。 ... [详细]

蜡笔小新 2024-12-27 19:10:10
merge
Java面试题解析

本文详细介绍了Java编程语言中的核心概念和常见面试问题，包括集合类、数据结构、线程处理、Java虚拟机（JVM）、HTTP协议以及Git操作等方面的内容。通过深入分析每个主题，帮助读者更好地理解Java的关键特性和最佳实践。 ... [详细]

蜡笔小新 2024-12-27 13:55:14
merge
使用Numpy实现无外部库依赖的双线性插值图像缩放

本文介绍如何仅使用Numpy库，通过双线性插值方法实现图像的高效缩放，避免了对OpenCV等图像处理库的依赖。文中详细解释了算法原理，并提供了完整的代码示例。 ... [详细]

蜡笔小新 2024-12-28 13:15:40
merge
深入理解 SQL 视图、存储过程与事务

本文详细介绍了SQL中的视图、存储过程和事务的概念及应用。视图为用户提供了一种灵活的数据查询方式，存储过程则封装了复杂的SQL逻辑，而事务确保了数据库操作的完整性和一致性。 ... [详细]

蜡笔小新 2024-12-27 17:40:42
merge
Dockerfile 编写与 Docker 网络配置详解

本文详细介绍了 Dockerfile 的编写方法及其在网络配置中的应用，涵盖基础指令、镜像构建与发布流程，并深入探讨了 Docker 的默认网络、容器互联及自定义网络的实现。 ... [详细]

蜡笔小新 2024-12-27 17:31:41
merge
数据库内核开发入门 | 搭建研发环境的初步指南

本课程将带你从零开始，逐步掌握数据库内核开发的基础知识和实践技能，重点介绍如何搭建OceanBase的开发环境。 ... [详细]

蜡笔小新 2024-12-27 16:38:48
format
Yii2 GridView 实现列表页数据直接编辑的完整指南

本文详细介绍了如何使用 Yii2 的 GridView 组件在列表页面实现数据的直接编辑功能。通过具体的代码示例和步骤，帮助开发者快速掌握这一实用技巧。 ... [详细]

蜡笔小新 2024-12-27 16:27:52
format
XenApp 应用程序命令行参数传递优化

本文探讨了如何在发布 XenApp 应用时，通过命令行参数实现启动时的参数传递。特别介绍了静态和动态参数传递的方法，并详细解释了 ICA 文件中两种参数传递方式的区别及安全检查机制。 ... [详细]

蜡笔小新 2024-12-27 13:28:49
format
CentOS7源码编译安装MySQL5.6

2019独角兽企业重金招聘Python工程师标准一、先在cmake官网下个最新的cmake源码包cmake官网：https:www.cmake.org如此时最新 ... [详细]

蜡笔小新 2024-12-27 17:49:56
input
JQuery基础：省市联动与表单验证

本文介绍了如何使用JQuery实现省市二级联动和表单验证。首先，通过change事件监听用户选择的省份，并动态加载对应的城市列表。其次，详细讲解了使用Validation插件进行表单验证的方法，包括内置规则、自定义规则及实时验证功能。 ... [详细]

蜡笔小新 2024-12-27 17:10:48

mobiledu2502912043

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章